AI资讯新闻榜单内容搜索-AI Lab

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: AI Lab

缺数据也能拿SOTA？清华&上海AI Lab破解机器人RL两大瓶颈

缺数据也能拿SOTA？清华&上海AI Lab破解机器人RL两大瓶颈

缺数据也能拿SOTA？清华&上海AI Lab破解机器人RL两大瓶颈

视觉-语言-动作模型是实现机器人在复杂环境中灵活操作的关键因素。然而，现有训练范式存在一些核心瓶颈，比如数据采集成本高、泛化能力不足等。

来自主题: AI技术研报

8614 点击 2025-09-27 11:13

EMNLP2025 | SFT与RL的结合，vivo AI Lab提出新的后训练方法

EMNLP2025 | SFT与RL的结合，vivo AI Lab提出新的后训练方法

EMNLP2025 | SFT与RL的结合，vivo AI Lab提出新的后训练方法

监督微调（SFT）和强化学习（RL）微调是大模型后训练常见的两种手段。通过强化学习微调大模型在众多 NLP 场景都取得了较好的进展，但是在文本分类场景，强化学习未取得较大的进展，其表现往往不如监督学习。

来自主题: AI技术研报

8091 点击 2025-09-23 14:59

腾讯AI Lab首创RL框架Parallel-R1，教大模型学会「并行思维」

腾讯AI Lab首创RL框架Parallel-R1，教大模型学会「并行思维」

腾讯AI Lab首创RL框架Parallel-R1，教大模型学会「并行思维」

自从 Google Gemini 将数学奥赛的成功部分归功于「并行思维」后，如何让大模型掌握这种并行探索多种推理路径的能力，成为了学界关注的焦点。

来自主题: AI技术研报

8654 点击 2025-09-18 15:04

来自MIT的最新研究-RL's Razor｜展望LLMs Post-Training下的前沿探索与思考

来自MIT的最新研究-RL's Razor｜展望LLMs Post-Training下的前沿探索与思考

来自MIT的最新研究-RL's Razor｜展望LLMs Post-Training下的前沿探索与思考

来自MIT Improbable AI Lab的研究者们最近发表了一篇题为《RL's Razor: Why Online Reinforcement Learning Forgets Less》的论文，系统性地回答了这个问题，他们不仅通过大量实验证实了这一现象，更进一步提出了一个简洁而深刻的解释，并将其命名为 “RL's Razor”（RL的剃刀）。

来自主题: AI技术研报

7526 点击 2025-09-18 14:26

OpenAI内部大重组！模型行为团队并入Post Training，负责人另起炉灶

OpenAI内部大重组！模型行为团队并入Post Training，负责人另起炉灶

OpenAI内部大重组！模型行为团队并入Post Training，负责人另起炉灶

OpenAI又要成立新团队了！

来自主题: AI资讯

8832 点击 2025-09-08 17:19

OpenAI重组GPT-5「灵魂」团队！亚裔女负责人遭调离，罕见自曝AI幻觉祸首

OpenAI重组GPT-5「灵魂」团队！亚裔女负责人遭调离，罕见自曝AI幻觉祸首

OpenAI重组GPT-5「灵魂」团队！亚裔女负责人遭调离，罕见自曝AI幻觉祸首

OpenAI重磅结构调整：ChatGPT「模型行为」团队并入Post-Training，前负责人Joanne Jang负责新成立的OAI Labs。而背后原因，可能是他们最近的新发现：评测在奖励模型「幻觉」，模型被逼成「应试选手」。一次组织重组+评测范式重构，也许正在改写AI的能力边界与产品形态。

来自主题: AI技术研报

9767 点击 2025-09-07 12:20

唯快不破：上海AI Lab 82页综述带你感受LLM高效架构的魅力

唯快不破：上海AI Lab 82页综述带你感受LLM高效架构的魅力

唯快不破：上海AI Lab 82页综述带你感受LLM高效架构的魅力

近年来，大语言模型（LLMs）展现出强大的语言理解与生成能力，推动了文本生成、代码生成、问答、翻译等任务的突破。代表性模型如 GPT、Claude、Gemini、DeepSeek、Qwen 等，已经深刻改变了人机交互方式。

来自主题: AI技术研报

7957 点击 2025-08-26 11:30

混合数学编程逻辑数据，一次性提升AI多领域强化学习能力 | 上海AI Lab

混合数学编程逻辑数据，一次性提升AI多领域强化学习能力 | 上海AI Lab

混合数学编程逻辑数据，一次性提升AI多领域强化学习能力 | 上海AI Lab

近年来，AI大模型在数学计算、逻辑推理和代码生成领域的推理能力取得了显著突破。特别是DeepSeek-R1等先进模型的出现，可验证强化学习（RLVR）技术展现出强大的性能提升潜力。

来自主题: AI技术研报

8099 点击 2025-08-16 16:45

腾讯AI Lab|让AI左右互搏，无需人类数据也能自学成才！

腾讯AI Lab|让AI左右互搏，无需人类数据也能自学成才！

腾讯AI Lab|让AI左右互搏，无需人类数据也能自学成才！

当前训练强大的大语言模型（LLM），就像是培养一个顶尖运动员，需要大量的、由专家（人类标注员）精心设计的训练计划和教材（高质量的标注数据）。

来自主题: AI资讯

9024 点击 2025-08-13 11:55

从捍卫者到引路人，上交&上海AI Lab提出LEGION：不仅是AI图像伪造克星，还能反哺生成模型进化？

从捍卫者到引路人，上交&上海AI Lab提出LEGION：不仅是AI图像伪造克星，还能反哺生成模型进化？

从捍卫者到引路人，上交&上海AI Lab提出LEGION：不仅是AI图像伪造克星，还能反哺生成模型进化？

近年来，文生图模型（Text-to-Image Models）飞速发展，从早期的 GAN 架构到如今的扩散和自回归模型，生成图像的质量和细节表现力实现了跨越式提升。这些模型大大降低了高质量图像创作的门槛，为设计、教育、艺术创作等领域带来了前所未有的便利。

来自主题: AI技术研报

8377 点击 2025-08-12 11:31

上一页当前第3页,共15页下一页